Alle bedrijven, instellingen en overheden moeten data opslaan en bewaren. Daarbij moeten ze rekening houden met verschillende eisen. Het is een proces dat dagelijks plaatsvind en waarbij iedereen naar het heden en de nabije toekomst kijkt. Daardoor wordt een belangrijk punt over het hoofd gezien: het verleden, de eerste digitale of elektronische bestanden.
Verschillende voorschriften
Als het gaat om opslaan en bewaren weten we dat wat de belastingdienst verwacht iets anders is dan de archiefwet voorschrijft. Wat voor de afwikkeling van klantcontact en garanties nodig is is ook weer anders. Bijna haaks op die wettelijke plichten staan trends als dataminimalisatie en de onmogelijkheid zonder geldige redenen persoonsgegevens op te slaan.
Voor het overgrote deel van de data geldt daarbij tegenwoordig dat het om digitale, of elektronische bestanden, databases of dossiers gaat. Die zijn afhankelijk van applicaties om te kunnen worden aangemaakt, veranderd en gelezen. Bij papieren dossiers was dat laatste nooit een issue. Iets op papier heeft geen “app” nodig om gelezen te worden.
Toename van bestanden
Wat hierboven staat is bij iedereen bekend. De meeste lezers weten ook dat het aantal elektronische bestanden veel sneller toeneemt in aantal en omvang dan ooit bij de papieren voorgangers het geval was. Er zijn zelfs nieuwe termen voor verzonnen om die trend te kunnen duiden. Men spreekt van datastuwmeren om aan te geven dat het om heel veel data gaat.
Achter die term gaat dan wel weer een commerciële boodschap schuil. Er is speciale software nodig de naald in de hooiberg te vinden. Of het heet dat er software nodig is om verbanden te kunnen leggen tussen data en datasets die nu nog niet mogelijk is. Daarbij wordt regelmatig “voor het gemak” vergeten dat er een strikte scheiding gemaakt moet worden tussen data met persoonsgegevens en andere data.
Maar is het nog leesbaar?
Maar of men de data “slechts” bewaard omdat het moet, of omdat er nog later mee gewerkt gaat worden maakt voor het beantwoorden van de volgende vraag niet uit. Dat is de vraag hoe een houder van data kan garanderen dat na het opslaan van de nullen en enen deze over X jaar nog leesbaar zijn. Onleesbare data kan een hoog prijskaartje hebben. De belastingdienst heeft wat dat betreft geen gevoel voor humor. Een accountant of auditor kan een tot een vervelend oordeel komen waardoor bijvoorbeeld de verkoop van het bedrijf niet kan doorgaan.
Iedereen die aan het bewaren van data denkt, denkt toch ook door bovenstaande vaak aan termijnen van tien tot twintig jaar. De archiefwet is wat dat betreft een uitzondering. Maar wie staat er bij stil dan in de bouw en voor IE (Intellectueel Eigendom) in principe een oneindige houdbaarheid van data vereist is. Dat noemen we in de regel geen opslag van data meer maar archivering.
Probleem van de oudere data
En met dat laatste is iets aan de hand. Het is een olifant in de kamer die iedereen ziet staan maar waar nooit iemand naar wijst. We hebben zoveel data en vooral ook verschillende applicaties dat zo goed al niemand kan garanderen zijn oudste data nog te kunnen lezen. Technische problemen met datadragers zijn een punt van zorg. Het ontbreken van applicaties is een ander. De eerste generaties documenten opgesteld door tekstverwerkers als Wordperfect gaan echt een uitdaging worden als die over tien jaar nog eens moeten worden gecontroleerd.
Wie staat er bij stil?
Ondernemers staan in de regel niet stil bij het potentieel dure probleem van de onleesbare oudere digitale data. IT beheerders of dienstverleners doen dat evenmin. Zij komen immers pas in actie als de klant er om vraagt.
Wie er eerder bij stil staan zijn de professionals die door archieven en data spitten. In de hoek van de wetenschap, de bibliotheken en bij de grote archieven zijn er ook goede oplossingen beschikbaar. Er is ook een groep die geen oplossing paraat heeft maar ondertussen wel vaker in webinars en dergelijk aandacht vraagt voor het onderwerp. Dat zij de accountants en auditors. Die bespreken het onderling, omdat zij steeds vaker tegen het genoemde probleem aanlopen. Maar dat lost vooralsnog niets op. Zij constateren namelijk ook dat echt lange dataretentie van digitale bestanden op dit moment nog te weinig aandacht heeft.
Toegegeven, voor de IT beheerder van de bakker op de hoek is de problematiek van het opslaan voor de lange termijn van data geen onderwerp dat hij met zijn klant bespreekt. Er is ook niet direct een drive dat te doen. En als het wel aan de orde komt, dan is het waarschijnlijk te laat.